Cell Rep Med︱聂秀/孟斌/全雪萍团队使用自注意力增强的卷积神经网络预测结直肠癌微卫星不稳定性
撰文︱全雪萍
责编︱王思珍,方以一
编辑︱杨彬薇
结直肠癌(CRC)是中国第四大常见恶性肿瘤。其中15%的结直肠癌中发生的错配修复(MMR)缺陷导致微卫星不稳定(MSI),是促进肿瘤发生的一种独特机制。MSI已越来越多地用于指导结直肠癌的化疗和免疫治疗。当前PCR和免疫组化检测MSI的敏感性和特异性很高,但这些检测方法需要较长时间的人工投入,并需要具有多年经验的病理学医师判读才能达到高准确率。人工智能开启精准病理诊断新时代。MSI-H/dMMR结直肠癌切片中具有较为特殊的病理学特征,如肿瘤浸润淋巴细胞和黏液分化等。因此可通过深度学习等人工智能手段来基于病理切片扫描片识别MSI的状态。
2023年1月30日,华中科技大学同济医学院附属协和医院病理科聂秀教授、天津医科大学肿瘤医院病理科孟斌教授、上海桐树生物科技有限公司全雪萍博士等合作在Cell Reports Medicine上发表了题为“Predicting colorectal cancer microsatellite instability with a self-attention-enabled convolutional neural network”的研究。该研究构建了包含1579个结直肠癌患者的多中心中国人群队列,通过整合卷积神经网络模型INSIGHT,和基于自注意机制的模型WiseMSI,实现了基于H&E染色的病理切片扫描片,准确识别患者的MSI状态。INSIGHT对肿瘤和正常组织分类识别的AUC值高达0.98,并基于此分类计算肿瘤纯度,与病理专家人工判读的肿瘤纯度Pearson相关系数为0.7909. WiseMSI对MSI的预测特异性为94.7% (95% CI 93.7% - 95.7%),灵敏度为84.7% (95% CI 82.6% - 86.9%), AUC值为0.954 (95% CI 0.948 - 0.960).在对比分析中,该方法相比五种经典深度学习方法具有更好的性能。
研究者使用ResNet18对包含254张病理图像的25349张正常区域的小图片及25235张肿瘤小图片进行训练构建了一个高精度的模型INSIGHT,随后在51张病理图像的2549张正常小图片及2373张肿瘤小图片进行测试(图1A),显示分类识别的AUC高达0.985,并且基于此分类计算肿瘤纯度,与病理专家判读的肿瘤纯度Pearson相关系数为0.7909。
随后研究者将肿瘤区域的小图片挑选出来通过基于ImageNet预训练的ResNet50提取肿瘤组织特征。并基于池化注意力机制的神经网络WiseMSI将小图片层级特征进行整合,预测MSI的状态(图1B)。自注意力网络结构(图1C)。
图1 INSIGHT及WiseMSI模型训练和测试的工作流与网络结构
(图源:Chang XN, et al., Cell Reports Medicine, 2023)
该多中心队列TSMCC共1579张病理图像,其中997张MSS图像,582张MSI-H图像,为了评估模型可靠性,研究者随机将其分为10个子集进行了交叉验证,最终WiseMSI对MSI的预测特异性为94.7% (95% CI 93.7% - 95.7%),灵敏度为84.7% (95% CI 82.6% - 86.9%), AUC值为0.954 (95% CI 0.948 - 0.960).研究者选取了在Laleh等的基准分析中表现优异的4个模型:经典弱监督路线的EfficientNet和ViT、多实例学习路线的MIL和AttMIL,以及DeepSMILE中的VarMIL模型,使用TSMCC队列进行训练测试,与WiseMSI 进行性能比较,INSIGHT+WiseMSI表现出更高的性能。
图2 INSIGHT及WiseMSI模型训练和测试的工作流与网络结构
(图源:Chang XN, et al., Cell Reports Medicine, 2023)
WiseMSI模型的肿瘤区域注意力分数图反映了MSI-H患者和MSS患者之间肿瘤的差异(图3),具有高注意力分数的红点对预测MSI状态的贡献比具有低注意力分数的蓝点更大。MSI-H病理图像中红点中的细胞形态分化较差,而MSS病理图像中的细胞形态分化较高。这与Greenson[1]和Kather[2]以前的发现类似。这一发现进一步证实了组织病理学特征可以作为MSI状态的预测因子,并说明了通过深度学习方法从H&E染色切片中检测MSI的原因。因此,注意力得分所突出的区域提供了一种可视化和解释深度学习模型预测的方法。
图3 肿瘤区域注意力分数图及放大图
(图源:Chang XN, et al., Cell Reports Medicine, 2023)
研究者进一步研究了WiseMSI在CRC患者的不同临床病理学亚组中的预测稳健性。本研究数据集的结直肠癌患者包括七个人口学、解剖学和病理学上不同的亚组,包括结肠癌、直肠癌、左右半结肠癌、低和中等组织学分化程度、有或没有林奇综合征、不同临床分期、年龄和性别。WiseMSI的表现在临床分期和患者年龄方面存在一些差异:AUC值为I期癌症(n = 35 WSIs)的0.79、II期(n = 164 WSIs)的0.94、III期(n = 133 WSIs)的0.95(图4C);年龄<40岁(n = 58 WSIs)的0.87、年龄大于40岁且小于等于70岁(n = 823 WSIs)的0.90、70岁以上(n = 216 WSIs)为0.80(图4B)。WiseMSI的分类表现与解剖学特征相关的变化相对较小:结肠癌(n = 753 WSIs)的AUC值为0.92、直肠癌(n = 247 WSIs)为0.85(图4E);左半结肠癌(n = 228 WSIs)的AUC值为0.85、右半结肠癌(n = 58 WSIs)为0.93(图4F)。WiseMSI的分类表在与组织学分化程度、林奇综合征和性别相关的亚组中非常稳定(AUC值约为0.90)。总的来说,WiseMSI模型在所有研究的亚组中对MSI的预测表现良好。
研究者在用外部数据 TCGA-COAD和READ队列对WiseMSI进行验证时,AUC从交叉验证的95.4%降到71.8%,其中灵敏度76.6%,特异性46.5%,但在不同种族来源的数据中显出极大的差异,对12个来自亚洲人群样本的MSI的预测正确性、灵敏度、特异性均达到了100%。目前在其他同类型研究中,AI模型训练和测试数据主要来自欧美人群,亚洲人群代表性样本不足。
图4 WiseMSI在结直肠癌患者异质性临床病理亚组MSI预测中的表现
(图源:Chang XN, et al., Cell Reports Medicine, 2023)
随后研究者进一步研究了WiseMSI预测结直肠癌患者生存情况的稳健性。TSMCC队列中有293名患者具备人口学和临床信息,在排除了63名没有生存数据的结直肠癌患者后,生存分析中包括了 226 名结直肠癌患者。通过PCR+毛细管电泳分析,21名患者是MSI-H,205名患者是MSS。MSI-H患者的60个月无病生存期(Disease-free survival,DFS)率高于MSS患者(MSI-H:100.0%对MSS:83.9%)。WiseMSI模型中有14名MSI-H患者和212名MSS患者。预测为MSI-H的患者的60个月DFS率也高于预测为MSS的患者(MSI-H:100.0%对MSS:84.4%)。此外,MSS患者的DFS与预测为MSS的患者的相当(MSS:58.3±1.5个月,95%CI 55.3到61.3个月对预测的MSS:58.6±1.5个月,95%CI 55.7到61.5个月)。MSI状态对预后的影响与肿瘤临床分期有关。MSI是II-III期结直肠癌的阳性预后因素。
通讯作者:全雪萍博士
(照片提供自:全雪萍团队)
全雪萍博士,北京“高聚”人才,英国爱丁堡大学生物信息学博士,爱丁堡大学智能系统及应用中心(CISA)、帝国理工大学等科研院所博士后,先后承担欧盟、欧洲学术研究委员会和英国心脏基金会等多项大型课题。熟悉生物信息、人工智能、精准医学领域等,发表多篇国际SCI文章和多项专利。
参考文献(上下滑动阅读)
[1] Greenson, J.K., Bonner, J.D., Ben-Yzhak, O., Cohen, H.I., Miselevich, I.,Resnick, M.B., Trougouboff, P., Tomsho, L.D., Kim, E., Low, M., et al. (2003). Phenotype of microsatellite unstable colorectal carcinomas: well-differentiated and focally mucinous tumors and the absence of dirty necro-sis correlate with microsatellite instability. Am. J. Surg. Pathol. 27,563–570.
[2] Kather, J.N., Pearson, A.T., Halama, N., Ja¨ ger, D., Krause, J., Loosen,S.H., Marx, A., Boor, P., Tacke, F., Neumann, U.P., et al. (2019). Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer. Nat. Med. 25, 1054–1056.
[3] Ghaffari Laleh, N., Muti, H.S., Loeffler, C.M.L., Echle, A., Saldanha, O.L., Mahmood, F., Lu, M.Y., Trautwein, C., Langer, R., Dislich, B., et al. (2022). Benchmarking weakly-supervised deep learning pipelines for whole slide classification in computational pathology. Med. Image Anal. 82, 102622.